Revisiting the challenges and surveys in text similarity matching and detection methods
نویسندگان
چکیده
The massive amount of information from the internet has revolutionized field natural language processing. One challenges was estimating similarity between texts. This been an open research problem although various studies have proposed new methods over years. paper surveyed and traced primary in text similarity. aim to give a broad overview existing issues, applications, research. identified four issues several applications matching. It classified current based on intrinsic, extrinsic, hybrid approaches. Then, we them into lexical-similarity, syntactic-similarity, semantic-similarity, structural-similarity, hybrid. Furthermore, this study also analyzed discussed method improvement, limitations, topic for future directions.
منابع مشابه
investigation of single-user and multi-user detection methods in mc-cdma systems and comparison of their performances
در این پایان نامه به بررسی روش های آشکارسازی در سیستم های mc-cdma می پردازیم. با توجه به ماهیت آشکارسازی در این سیستم ها، تکنیک های آشکارسازی را می توان به دو دسته ی اصلی تقسیم نمود: آشکارسازی سیگنال ارسالی یک کاربر مطلوب بدون در نظر گرفتن اطلاعاتی در مورد سایر کاربران تداخل کننده که از آن ها به عنوان آشکارساز های تک کاربره یاد می شود و همچنین آشکارسازی سیگنال ارسالی همه ی کاربران فعال موجود در...
ideological and cultural orientations in translation of narrative text: the case of hajji baba of isfahan
در میان عواملی که ممکن است ذهن مترجم را هنگام ترجمه تحت تأثیر قرار دهند، می توان به مقوله انتقال ایدئولوژی از طریق متن یا گفتمان اشاره کرد. هدف از این تحقیق تجزیه و تحلیل جنبه های ایدئولوژیکی و فرهنگی متن مبدأ انگلیسی نوشته جیمز موریه تحت عنوان سرگذشت حاجی بابای اصفهانی ( 1823) و ترجمه فارسی میرزا حبیب اصفهانی(1880) بوده است.
data mining rules and classification methods in insurance: the case of collision insurance
assigning premium to the insurance contract in iran mostly has based on some old rules have been authorized by government, in such a situation predicting premium by analyzing database and it’s characteristics will be definitely such a big mistake. therefore the most beneficial information one can gathered from these data is the amount of loss happens during one contract to predicting insurance ...
15 صفحه اولStatistical Matching in ‘Labour Force’ and ‘Time Use’ Surveys
Abstract. In the National Statistical Systems, some parts of the official statistics required for development planning and evidence base management are collected through sampling survey. Due to the high cost of sampling process, as well as nonresponses, it may not be possible to collect all of the expected variables in a survey.In order to obtain a comprehensive and complete source o...
متن کاملidentifying the strategies persian efl learners use in reading an expository text in english and examining its relation to reading-proficiency and motivation: a think-aloud study
هدف اصلی از این مطالعه بررسی نوع و میزان استراتژی هایی بود که دانشجویان فارسی زبان رشته ی زبان انگلیسی در حین خواندن یک متن انگلیسی به کار گرفتند. این مطالعه همچنین به بررسی تفاوت های استراتژی های مورد استفاده بین دارندگان سطح بالا و پایین درک مطلب پرداخت. نوع همبستگی بین استراتژی به کار گرفته و درک مطلب از یک سو و استراتژی به کار گرفته و انگیزه از سوی دیگر نیز در این تحقیق مورد آزمایش قرار گرف...
15 صفحه اولذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Jurnal Informatika
سال: 2022
ISSN: ['1411-0105', '2528-5823']
DOI: https://doi.org/10.26555/jifo.v16i3.a23471